PyDigger - unearthing stuff about Python

Found 4 out of 323,394. Showing 4 on page 1. Total pages: 1.

Name	Version	Summary	date
trl	0.22.2	Train transformer language models with reinforcement learning.	2025-09-03 14:41:58
trl-fpo	0.0.14	Train transformer language models with reinforcement learning.	2025-01-18 04:51:57
nemo-aligner	0.6.0	NeMo-Aligner - a toolkit for model alignment	2025-01-07 23:05:48
shtec-rlhf	1.0.5	shtec-rlhf: Safe Reinforcement Learning from Human Feedback	2024-06-24 05:55:07

Found 4 out of 323,394. Showing 4 on page 1. Total pages: 1.